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摘要 : [目的 /意义 ] 基 于 现 有 政策 内 容 对 科研 数据 政策 未 来 仍 需 改进 之 处 进行 讨论 ， 以 期 为 

出 版 界 制定 统一 、 完 备 的 开放 数据 政策 提供 参考 借鉴 。[ 方 法 /过 程 ] 在 密集 型 数据 环境 下 ， 本 

研究 选取 国外 著名 、 主 流 、 较 为 具有 代表 性 的 8 所 出 版 机 构 为 研究 对 象 ， 以 出 版 商 平 台 、 期 刊 

网 站 、re3data.org 数据 仓储 目录 系统 为 数据 来 源 ， 将 出 版 机 构 的 数据 政策 内 容 ， 按 照 呈 缴 政 

策 、 存 储 政策 和 利用 政策 三 个 方面 进行 总 结 、 分 析 。[ 结 果 / 结 论 ] 未 来 应 积极 完善 数据 呈 缴 政策 、 
建立 同行 评议 模式 、 规 范 仓储 、 明 确 数据 再 利用 方式 。 
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Abstract: With the environment of intensive research data, the paper selected the famous, 
mainstream and representative 8 publishing institutions as the research object, the publishing 
platform, the journal website and 're3data.org'as the data source, from the three aspects of open 
scientific data submission policy, storage policy and use policy to summary and analysis the 
publishing institutions. Based on the existing policy content of scientific data policy, exploring the 
future still need to enhance the discussion, in order to provide reference for the publishing industry 
to develop a unified and complete open data policy. 
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科研 数据 是 数字 信息 时 代 从 事 科 学 研究 所 必 不 可 少 的 战略 资源 ， 是 具有 重要 科研 价值 
的 数据 集合 ， 其 产生 于 资料 收集 分析 实 验 、 科 研 产 出 等 过 程 中 ， 是 科学 、 技 术 、 医 学 等 领域 
知识 构建 的 基础 与 支撑 。 自 2001 年 12 月 , 《布达佩斯 开放 存 取 计划 》(Budapest Open Access 
Initiative，BOADD 提 出 ， 开 放 获 取 运 动 愈演愈烈 ， 科 研 数据 的 开放 共享 也 逐步 为 人 们 所 
HE; 2003 年 10 月 ， 德 国 马 普 学 会 提出 《关于 自然 科学 与 人 文科 学 资源 的 开放 获取 的 柏 
林 宣 言 》(Open Access to Knowledge in the Sciences and Humanities)， 倡 导 学 术 论 文 、 教 育 资 
源 、 科 研 数据 的 开放 共享 ， 呼 吁 各 大 科研 机 构 将 科学 资源 开放 获取 钼 ，2006 年 ， 经 济 合 作 
与 发 展 组 织 (Organization for Economic Cooperation and Development, OECD)PHB NIERA 
共 资 助 科 研 数据 的 及 时 性 、 易 获取 性 与 网 络 互联 性 等 ， 英 国 皇 家 学 会 在 2012 年 5 月 发 布 
《科学 。 开 放 的 事业 》 报 告 ， 其 指出 对 科学 理论 及 具体 实验 数据 的 即时 发 布 是 他 人 了 解 、 判 
断 该 研究 的 基础 ， 是 证 伪 和 创新 的 依据 所。 开放 科研 数据 作为 数字 网 络 环境 中 数据 信息 资 
源 共 享 的 一 种 新 方式 和 新 理念 ， 又 称 “ 开 放 科 学 数据 ”、“ 开 放 数 据 ”， 以 “Open 
Data", “Open Scientific Data”, “Open Research Data" 45 Jt 3 ET] KA", 

为 完善 科研 数据 开放 获取 制度 ， 国 内 外 政府 部 门 、 国 际 组 织 、 资 助教 育 机 构 等 利益 共同 
体 纷纷 出 台 科 研 数据 管理 与 共享 政策 ， 以 促进 科研 数据 的 可 获取 、 可 共享 、 可 重用 ， 并 期 许 
通过 科研 数据 的 开放 共享 实现 更 为 广泛 的 学 术 交 流 与 科研 融合 ， 实 现 科 学 研究 中 的 庄 新 的 
突破 。2011 年 4 月 ， 英 国 研究 理事 会 (RCUK) 发 布 《RUCK 数据 政策 通用 原则 》 日 ， 规 范 研究 
数据 的 使 用 规则 ;美国 白宫 科技 政策 办 公 室 (OSTP) 中 于 2013 年 2 月 发 布 的 政府 科研 数据 


开放 政策 中 指出 : “涉及 受 联邦 资助 的 科研 项 目 ， 所 产生 的 数字 形式 的 科研 数据 都 需 存储 
起 来 ， 并 提供 搜索 、 检索 和 使 用 等 的 公共 访问 、 共享”; 美国 也 透 过 GS 会 议 颁 布 政府 开放 
数据 宪章 ， 英 国 、 日 本 、 法 国 等 G8 成 员 积 极 响应 ， 加 拿 大 、 印度、 新 西 兰 等 国政 府 分 别 发 布 
了 开放 数据 的 声明 ， 澳 大 利 亚 、 巴 西 和 智利 出 台 了 数据 开放 和 保护 的 相关 政策 法 规 ， 中 国 
科学 院 制 定 的 《科学 数据 库 数据 共享 办 法 (试行 )》 中 ， 也 规范 了 其 与 建立 数据 库 的 各 单位 间 
在 数据 的 收益 分 配 、 产 权 归 属 等 方面 的 问题 ;我 国 复旦 大 学 社会 科学 研究 中 心 应 用 哈佛 大 
学 的 Dataverse 网 络 平台 ， 建 立 了 中 国 社会 科研 数据 共享 中 心 ， 北京 大 学 也 根据 科研 数据 
的 开放 共享 机 制 建立 的 北大 开放 数据 研究 平台 以 及 管理 科学 数据 中 心 等 。 
作为 开放 获取 运动 的 利益 相关 者 ， 科 研 数 据 交流 、 传 播 的 重要 媒介 ， 出 版 行业 也 先后 推 
了 科研 数据 开放 共享 的 相关 政策 ， 由 几 种 期 刊 杂志 提出 数据 政策 ， 到 各 主流 的 出 版 集团 
出 版 界 掀起 了 新 型 的 政策 浪潮 ， 力 求 构 建 一 种 与 出 版 物 相关 联 、 高 质量 、 适 宜 重 用 的 数据 
理 与 共享 模式 ， 通 过 验证 数据 的 真实 性 以 增强 出 版 物 的 可 信和 度 ， 从 而 提升 出 版 物 的 学 术 
价值 ， 并 为 开放 科学 事业 的 发 展 贡献 一 份 力量 。 然 而 ， 现 有 研究 成 果 中 尚未 对 国外 各 出 版 机 
构 开 放 科 研 数 据 政策 内 容 、 未 来 政策 发 展 与 改善 情况 做 以 系统 性 研究 ， 为 全 面 了 解 开放 科 丰 
` 数据 政策 目前 的 状况 与 具体 政策 未 来 可 能 需要 进行 完善 之 处 ， 本 研究 对 国外 出 版 机 构 开 放 
~ 科研 数据 政策 进行 了 调研 ， 选 取 了 8 所 国外 较为 著名 、 较 有 影响 力 的 传统 出 版 集团 与 新 型 开 
放 获 取出 版 机 构 ， 将 其 数据 政策 按照 呈 缴 政策 、 存 储 政策 、 利 用 政策 三 部 分 内 容 进 行 分 类 梳 
里 ， 并 对 其 未 来 的 发 展 趋势 进行 讨论 ， 为 完善 出 版 界 数据 政策 ， 推 动 科研 数据 的 自由 获取 、 
重 发 布 与 再 利用 提供 参考 借鉴 。 
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2. 研究 方法 


2.1 研究 对 象 


Science, Nature 等 期 刊 制定 的 科研 数据 存储 与 传播 政策 引领 了 出 版 行业 开放 数据 政策 的 
兴起 与 发 展 ， 随 后 PLOS、BioMed Central 等 出 版 机 构 针对 旗下 所 属 期 刊 提出 了 更 加 通用 、 明 
确 的 数据 共享 与 管理 政策 。 因 此 ， 本 研究 参考 国际 科学 、 技 术 与 医学 出 版 商 协 会 
(International Association of Scientific Technical & Medical Publishers, STM) 中 所 罗列 的 出 
O 版 商 成 员 机 构 包 、2016 年 度 世 界 排 名 前 52 位 的 图 书 出 版 机 构 (The World's 52 Largest Book 

Publishers, 2016) 钾 分 析 报 告 中 提 及 的 出 版 机 构 ， 结 合 开放 获取 出 版 环境 下 新 兴 的 开放 获 

取出 版 商 ， 以 及 众多 出 版 机 构 是 否 制定 科研 数据 政策 内 容 等 因素 。 最 终 ， 选 取 8 所 国外 较为 

知名 、 较 有 影响 力 的 出 版 机 构 一 一 施 普 林 格 "自然 (Springer Nature). 、 爱 思 唯 尔 (Elsevier) 、 

威 利 (Wiley) 、 泰 勒 -弗朗西斯 出 版 集团 〈Taylor & Francis Group) 、 牛 津 大 学 出 版 社 

C Oxford University Press, OUP ) 、Hindawi、 公 共 科 学 图 书馆 (Public Library of 

Science, PLOS) 、 和 生物 医学 出 版 集团 (BioMed Central, BMC) 所 提出 的 开放 科研 数据 政 

策 为 研究 分 析 对 象 。 

特别 注 明 之 处 ，BMC 于 2008 年 被 Springer 出 版 社 所 收购 ， 但 其 始终 致力 于 开放 获取 

出 版 行业 ，Springer 也 于 2015 年 与 Nature 出 版 社 合并 。 由 此 ， 本 研究 将 两 者 分 别 列 为 传统 
出 版 机 构 与 开放 获取 出 版 机 构 ， 从 两 个 角度 进行 比较 研究 。 


2.2 数据 来 源 


本 研究 所 得 数据 主要 来 源 于 各 出 版 机 构 的 官方 网 站 、 提 供 科研 数据 存储 仓储 列表 的 


Scientific Data 数据 期 刊 、 收 录 数 据 仓储 较为 全 面 的 注册 和 目录 系统 re3data.org， 并 结合 文献 
调研 对 内 容 进 行 补充 ， 调 研 截止 日 期 为 2017 年 4 月 25 日 。 

以 下 根据 各 出 版 机 构 的 科研 数据 共享 与 管理 政策 ， 分 别 对 具体 的 政策 内 容 要 素 和 政策 
未 来 的 发 展 与 改善 情况 进行 详细 的 阐述 。 


3. 出 版 商 开 放 科研 数据 政策 要 素 分 析 


纵 观 本 研究 所 选 的 8 所 出 版 机 构 ， 大 多 数 提出 的 数据 政策 都 处 于 试用 阶段 ， 部 分 机 构 
目前 处 于 政策 制定 初期 ， 政 策 条 款 已 初 见 模型 ， 具 体内 容 仍 不 完全 确定 ;部 分 机 构 数据 政 
策 的 使 用 仅 限 于 该 机 构 的 部 分 期 刊 ， 并 未 应 用 于 全 部 内 容 。 在 选取 的 出 版 机 构 中 ，Springer 
Nature, Elsevier 制定 的 数据 政策 内 容 较 为 详尽 ;PLOS、BMC 提出 数据 政策 的 时 间 虽 然 较 早 ， 
但 政策 条 款 较 少 且 宽 泛 ; Wiley. OUP 的 数据 政策 针对 部 分 开放 获取 期 刊 进行 试点 ; Taylor 
& Francis 与 Hindawi 的 数据 政策 处 于 建设 初期 ， 形 成 部 分 条 款 与 整体 框架 。 本 研究 根据 各 出 
版 商 的 数据 政策 内 容 ， 总 结 其 内 容 要 素 ， 从 呈 缴 、 审 查 与 存储 、 利 用 政策 进行 更 为 细致 的 分 
析 。 


N 3.1 数据 呈 缴 政策 

出 版 商科 研 数据 呈 缴 政策 主要 集中 于 数据 提交 为 可 选 /强制 性 、 数 据 提交 的 方式 、 提 交 时 
所 规定 的 数据 类 型 、 以 及 数据 的 格式 要 求 00。 

Springer Nature 出 版 商 针对 其 收录 的 所 有 期 刊 划 分 为 四 个 类 别 〈Type) ， 对 于 不 同期 
刊 的 科研 数据 提交 分 为 可 选 性 与 强制 性 ， 可 在 “作者 指南 ”、“ 编 辑 须 知 ”、“ 数 据 政策 ” 
模块 中 查看 具体 要 求 中 ， 其 将 数据 政策 中 不 同 特征 分 为 强制 性 、 推 荐 可 选 性 、 无 特殊 要 求 内 
容 ， 具 体 政策 内 容 说 明 见 表 1, 四 类 政策 中 ， 有 三 类 政策 希望 /要 求 作者 在 向 期 刊 提交 文章 与 
数据 集 时 ， 也 可 提供 一 份 数据 有 效 性 声明 (Data Availability Statements) ， 以 说 明 支 撑 文 章 
结论 的 数据 可 以 在 哪些 地 方 找 到 相关 信息 ; 研究 期 间 分 析 或 生成 的 公开 发 布 的 数据 集 的 链 
接 ; 数据 有 效 性 声明 还 应 明确 : 也 当前 研究 期 间 产 生 和 /或 进行 分 析 的 数据 集 可 在 某 知 识 库 
Es 中 获得 ; 包 本 研究 期 间 产 生 和 /或 进行 分 析 的 数据 集 如 果 不 可 公开 ， 说 明 原 因 [ 因 为 什么 数 
一 据 不 公开 ]， 但 是 可 以 根据 作者 提出 的 哪些 合理 性 要 求 后 提供 ; @@ 当 前 研究 期 间 和 /或 进行 
> 分 析 得 到 的 数据 集 可 按照 作者 提出 的 哪些 合理 性 需求 后 可 提供 ;四 数据 共享 如 果 不 适 用 于 
本 文 ， 说 明 原 因 [ 本 研究 期 间 没 有 生成 或 分 析 数 据 集 ]; @@ 本 研究 中 生成 或 进行 分 析 的 所 有 
数据 均 包 含 在 本 文 [及 其 补充 信息 文件 ] 中 。 同 时 ，Springer Nature 要 求 作 者 上 传 数据 的 方式 
与 类 型 主要 分 为 三 类 : 外 鼓励 作者 尽量 将 研究 数据 上 传 存 储 于 适宜 的 公共 仓储 (Public 
Repository) 中 ， 但 无 需 提 交 随 文章 一 同 提交 期 刊 ，@ 文 章 的 原始 文稿 中 的 描述 型 材料 《所 
有 相关 的 原始 数据 ) 需 随 文 章 一 并 提交 于 期 刊 ， 并 鼓励 作者 将 数据 集 存 储 与 公共 仓储 中 ; 
名 向 期 刊 提 供与 论文 结论 相关 的 所 有 数据 集 ， 且 在 文章 进行 同行 评议 之 前 将 数据 集 存 储 于 
公共 仓储 中 ， 作 为 文章 的 补充 材料 5。 
Elsevier 认为 科研 数据 是 建立 科学 、 技 术 和 医学 知识 的 基础 ， 但 在 其 访问 和 共享 方面 存 
在 挑战 ,根据 STM 布鲁塞尔 宣言 ，Elsevier 也 设想 未 来 可 轻松 、 有 效 地 存储 、 共 享 、 发 现 和 使 
用 数据 ， 以 支持 研究 人 员 的 工作 ， 并 促进 科学 与 健康 。 然而 ， 在 科研 数据 的 访问 、 共 享 方面 
存在 挑战 加。Elsevier 应 对 可 能 存在 的 挑战 也 制定 了 相应 的 推荐 性 科研 数据 政策 ， 并 于 2015 
年 实行 开放 数据 发 布 、 共 享 的 试点 计划 ， 鼓 励 作者 上 传 原始 研究 数据 至 Mendeley Data!"!, 
并 将 其 链接 到 所 属 ScienceDirect 文章 。Wiley 对 其 13 种 期 刊 开 通 了 开放 共享 数据 服务 ， 且 
13 中 期 刊 每 种 都 有 各 自 的 数据 政策 ， 具 体 了 解 每 种 期 刊 的 数据 政策 情况 ， 需 投稿 时 根据 期 


刊 主 页 面 中 的 详细 指南 进行 操作 器 。 这 13 种 期 刊 的 数据 文件 的 上 传 无 强制 性 的 要 求 ， 仅 将 
其 定义 为 可 选 性 的 数据 共享 协定 ， 数 据 集 无 格式 要 求 ， 也 无 需 随 文 章 一 并 提交 ， 如 签订 数 
据 共 享 许可 协议 的 文章 仅 需 上 传 至 公共 仓储 ， 提 供 数据 集 准确 链接 即 可 。OUP 与 Wiley 的 呈 
缴 政策 相 类 似 ， 但 OUP 强调 需要 提供 文章 的 数据 有 效 性 声明 ， 且 声明 中 需 明 确 数 据 的 有 效 
性 与 具体 应 用 之 处 ， 数 据 集 需 存储 于 标准 的 公共 仓储 中 ， 并 获得 相应 的 登记 号 09。Taylor & 
Francis (X i se f fled dé] URL"; Hindawi, PLOS, BMC 3x 3 所 开放 获取 出 版 商 则 格外 强 
调 数 据 有 效 性 声明 的 提交 器 ， 且 这 些 机 构 中 BMC 明确 指出 数据 文献 的 类 型 应 为 
XML、CSV、XLS/XLSX、RDF"”Y， 以 易于 统一 管理 并 进行 下 一 步 的 数据 挖掘 和 文本 内 容 的 分 
析 。 


表 1 Springer Nature 四 类 数据 政策 纵向 区 分 
Type 1 
(数据 集 开 
放 共 享 具有 
可 选择 性 


通过 仓储 进 | 作者 通过 期 刊 指南 中 
行 数 据 共享 | 提 到 仓储 分 享 数 据 

数据 引证 许 | 作者 根据 期 刊 指南 中 
可 要 求 ， 在 参考 文献 列 
表 中 加 入 进行 引用 公 
共 数 据 集 


出 版 商 的 帮 | 通过 选择 性 可 选择 性 | 可 选择 性 | 可 选择 性 
助 信息 服务 后 台 咨 询 细节 ， 
包括 作者 信息 等 
强制 性 
强制 性 


对 公共 数据 | 对 存储 的 数据 进行 检 可 选择 性 制 性 
的 存储 与 特 | 查 是 出 版 过 程 中 的 一 

定 类 型 数据 | 部 分 ， 是 研究 团体 的 

的 数据 集 标 | 任务 

识 符 的 检查 


数据 有 效 性 | 声明 在 出 版 的 文章 中 ,| 无 特殊 要 求 | 可 选择 性 
声明 用 以 解释 数据 被 获取 
的 要 求 


验证 所 需 的 | 数据 被 公共 获取 使 用 ,| 无 特殊 要 求 | 无 特殊 要 求 | 可 选择 性 
公共 数据 仓 | 并 给 所 有 已 出 版 的 文 
储 和 数据 标 | 章 提 供 数 据 标 识 符 
识 符 (除了 敏感 /隐私 数 
据 ) 


F 
集成 数据 仓 | 提交 系统 /审阅 过 程 集 | 无 特殊 要 求 | 无 特殊 要 求 强制 性 
LÀ 成 于 一 个 特殊 的 期 乔 

或 者 综合 性 仓储 
3.2 数据 审查 与 存储 政策 


据 本 研究 选取 的 出 版 机 构 中 ， 对 提交 的 数据 集 制定 审查 机 制 的 仅 有 Springer Nature 出 
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HET. Elsevier 是 将 原始 研究 数据 作为 补充 材料 供 编辑 与 审阅 者 共同 审 校 。 虽 然 Springer 
Nature 提出 的 审查 机 制 尚未 面向 全 体 期 刊 ， 但 选 定期 刊 的 数据 集 及 数据 有 效 性 声明 需 进 行 
同行 评议 ， 以 考察 作者 是 否 遵守 了 Springer Nature 关于 科研 数据 有 效 性 声明 所 提出 的 政策 
要 求 ， 以 及 是 否 已 经 为 支撑 研究 结果 的 科研 数据 可 供 其 他 研究 人 员 进 行 复制 或 者 再 利用 做 
出 了 努力 ,同行 评 议 者 有 权 要 求 对 其 底层 的 数据 (或 代码 ) 进行 访问 ， 以 便 对 手稿 进行 评估 。 
数据 有 效 性 声明 的 审阅 者 需要 考虑 以 下 问题 六 : (1) 读者 是 否 可 以 查看 数据 ? (2) 在 
DAS 中 提供 的 链接 ， 是 否 可 以 正常 使 用 ? G) 在 数据 的 访问 受 限 时 ， 限 制 访问 的 条 件 是 
BAH? OD 对 于 数据 的 描述 ， 说 明 其 包括 在 手稿 和 /或 补充 信息 的 文件 中 ， 是 否 准确 ? 
对 于 数据 文件 ， 审 阅 者 应 该 考虑 : Cd) 数据 是 否 存 储 于 最 合适 的 仓储 中 ?” (2) 数据 是 否 
以 严谨 的 方法 论 而 产生 ? G) 数据 及 元 数据 是 否 符合 学 术 界 的 文本 格式 与 报告 标准 ? 
(D 作者 存储 的 数据 文档 是 否 完整 ， 并 且 与 稿件 的 描述 是 否 相 符 ? C 数据 集中 是 否 
括 个 人 信息 、 敏 感 信息 或 不 当 信息 ? 

出 版 商 数据 存储 政策 中 ， 绝 大 多 数学 科 类 型 的 数据 ， 其 存储 仓储 的 选择 可 由 作者 自行 
决定 ， 可 上 传 至 Figshare, Dryad 一 类 适用 于 存储 所 有 类 型 的 研究 数据 的 综合 性 数据 仓储 ， 
也 可 上 传 至 学 科 专 用 类 数据 仓储 ，Springer Nature 仅 对 生命 科学 类 期 刊 的 专用 数据 仓储 给 
pu 定 了 参照 列表 ， 且 Springer Nature 根据 其 发 行 的 开放 获取 数据 期 刊 Scientific Data 为 作者 提 
CO 供 了 推荐 性 数据 仓储 列表 请 ， 作 者 可 根据 喜好 或 需求 进行 选择 。Elsevier 出 版 商 要 求 但 不 强 
es 制作 者 将 数据 集 添加 到 Mendeley Data 数据 管理 空间 中 ， 数 据 集 可 在 Mendeley Data 上 根据 
C 作者 所 选择 的 许可 协议 被 他 人 所 使 用 的 ， 且 Mendeley Data 会 为 数据 集 分 配 DOI， 并 与 
ScienceDirect 上 的 文章 相关 联 ， 读 者 可 以 通过 文章 进而 访问 数据 集中 。 其 他 各 出 版 机 构 未 规 
定数 据 存 储 仓储 或 提 及 推荐 仓储 ， 和 赁 作者 自由 选择 即 可 。 


N 3.3 数据 利用 政策 

Springer Nature, BMC 规定 数据 利用 时 遵从 CC 0 割 免 协定 ， 且 具体 的 使 用 许可 以 数据 
集 存储 的 数据 仓储 为 准 ; Elsevier 中 的 数据 文件 遵循 CC BY 许可 协议 ，Wiley 对 于 上 传 数据 
的 使 用 许可 采用 CC 0 协定 ， 并 人 允许 进行 数据 挖掘 以 及 大 规模 的 元 分 析 〈meta-analyses) T 
fp; 其 他 出 版 商 在 其 网 站 上 没有 明确 说 明 数 据 文档 的 使 用 许可 ， 主 要 参照 数据 集 所 属 的 论 
文 的 使 用 许可 进行 使 用 ， 因 此 还 要 参见 具体 数据 仓储 的 使 用 许可 限制 后 再 行 利用 。 
z 开放 科学 数据 仓储 的 产生 与 发 展 反映 了 开放 科学 数据 数量 增长 与 人 们 对 开放 科学 数据 
PT 利用 的 需求 增加 。 开 放 科 学 数据 仓储 的 建设 主体 有 单一 的 高 校 、. 科 研 院 所 、 出 版 商 等 ， 也 有 跨 
组 织 、 跨 地 区 的 合作 ， 如 欧盟 CESSDA Dada Portal. 数据 的 来 源 主要 有 以 下 两 种 ， 一 是 强制 
要 求 科 研 人 员 提 交 研 究 中 涉及 的 研究 数据 ， 如 Springer Nature 等 出 版 商 ; 二 是 鼓励 或 建议 
科研 人 员 提 交 相 关 科学 数据 ， 如 PLOS One 等 。 由 于 数据 存储 库 庞 杂 ， 使 研究 人 员 较 难 发 现 
并 选择 自己 所 需 数 据 的 来 源 ， 所 以 出 现 了 一 些 数据 仓储 的 注册 和 目录 系统 ， 如 OAD (Open 

Access Directory， 开 放 获 取 仓 储 ) 、re3data.org、Databib 等 。 
由 于 Scientific Data 作为 较 早 发 行 的 数据 期 刊 ， 所 涉及 的 数据 仓储 较为 权威 、 规 范 ， 且 
re3data.org 中 收录 的 数据 仓储 的 数量 较 大 ， 学 科 分 类 较为 细致 ， 学 科 主题 较 多 。 因 而 ， 以 
Scientific Data 期 刊 、re3data.org 为 数据 来 源 ， 比 较 分 析 数 据 仓储 中 科研 数据 的 使 用 许可 。 
Scientific Data 期 刊 中 推荐 的 开放 科研 数据 仓储 包括 各 个 学 科 ， 且 为 Springer Nature 出 版 商 
集团 下 各 种 期 刊 杂 志 所 推荐 的 开放 数据 存储 共享 平台 ， 同 时 也 受到 其 他 各 出 版 商 的 推崇 。 
re3data.org 平台 中 收录 的 仓储 数量 ， 经 不 完全 统计 ， 近 年 来 呈 逐 年 递增 趋势 ， 仓 储 的 类 型 
主要 分 为 国家 类 、 政 府 类 、 机 构 类 ， 以 及 出 版 商 自 建 的 数据 仓储 等 ， 其 建设 主体 包括 高 校 、 科 
研 院 所 、 出 版 商 等 ， 仓 储 建设 的 主要 目的 为 开放 共享 与 提供 科研 数据 管理 工具 两 类 ， 由 此 也 
使 得 其 学 科 分 布 不 均 ， 生 命 科学 领域 的 数据 仓储 体 量 较 大 ; 用 于 数据 共享 的 交换 协议 也 存 
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在 差异 ;， 且 美国 在 建设 开放 数据 仓储 中 表现 最 为 突出 。 
将 数据 来 源 中 的 仓储 进行 统计 ， 目 前 约 


re3data.org 中 的 数据 仓储 对 应 的 数据 许可 和 数据 库 许 可 请 ， 主 要 分 为 三 类 。 
(1) 数据 获取 & 数据 库 获 取 : 数据 /数据 库 的 开放 程度 主要 分 为 四 种 情况 ， 即 开放 、 


存在 一 定 的 限 


2000 余数 据 仓储 以 被 记录 ， 且 收录 在 


( 见 图 1) 


BJ 《需要 注册 、 身 份 认 证 )、 被 禁止 获取 (只 读 性 )、 完 全 不 可 见 ( 仪 限 机 构 内 
部 或 项 目 工 作 组 的 人 员 使 用 〉 。 数 据 可 以 开放 获取 的 占 全 部 总 数 〈2768) 的 56.4%; 获取 具 


有 一 定 限制 的 数据 占有 32%; 不 可 获取 的 占 比 为 11.6%。 数据 仓储 的 开放 程度 分 为 三 种 情况 ， 
完全 开放 的 占 比 为 94.5%; 具有 限制 的 占 比 5%; 不 开放 的 占 比 0.5%。 

(2) 数据 获取 受 限 & 数据 库 获取 受 限 : 数据 /数据 库 开放 受 限 的 原因 主要 分 为 以 下 几 
种 情况 ， 需 注册 、 机 构成 员 、 需 付费 、 其 他 。 其 中 数据 /数据 库 受 限 的 原因 主要 是 需要 注册 后 开 
放 获 取 ， 对 机 构成 员 的 要 求 最 小 ， 部 分 原因 还 未 知 。 


(3) 数据 许可 /数据 库 许 可 : 主要 还 是 有 版 权 〈Copyright) 限制 ; 
其 中 CC 0 占有 的 比重 较 大 ， 说 明月 


可 协议 ， 


次 是 遵循 CC 许 


了 利用 的 限制 较 低 ;， 其 他 许可 还 包括 : Apache 


License 2.0、BSD (Berkeley Software Distribution， 开 源 许 可 协议 ) ~ ODC (Open Data 
Commons， 开 放 数 据 协议 ) ~ OGL (Open General license， 开 放 许 可 ) 、 公 有 领域 、 其 他。 


数据 获取 许可 权限 与 数据 库 许 可 权限 比较 图 示 
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1 许可 限制 见 的 比较 
ik: 图 1 中 数据 来 源 于 re3data.org 平台 ， 经 统计 整理 所 得 。 


4. 出 版 商 数据 政策 的 未 来 发 展 趋势 与 建议 


出 版 商 在 推动 科研 数据 管理 与 共享 的 事业 中 已 做 出 尝试 ， 依 据 现 有 数据 政策 的 制定 与 
推行 趋势 ， 日 后 出 版 商 开 放 科 研 数据 政策 更 将 日 益 完善 。 然 而 ， 目 前 建立 的 各 种 政策 中 主要 
以 推荐 、 鼓 励 性 政策 为 主 ， 应 逐步 制定 强制 性 、 必 备 性 政策 ， 并 将 数据 引用 的 注意 事项 纳入 
规定 范围 。 数 据 期 刊 的 兴起 ， 为 科研 数据 的 出 版 、 分 享 与 传播 开启 了 同行 评议 机 制 ， 相 应 在 
科研 数据 作为 文章 附件 、 补 充 材料 、 数 据 支 撑 时 ， 也 应 建立 同行 评议 过 程 以 认定 其 作为 学 术 
成 果 的 价值 。 科 研 数据 在 开放 存储 与 利用 模式 尚未 明确 ， 同 时 开展 文本 与 数据 挖 所 (text 
and data mining， 简 称 TDM) 的 服务 ， 进 行 元 数据 分 析 ， 也 是 未 来 可 实践 内 容 。 


4.1 出 版 商 数据 政策 有 日 趋 完善 之 势 


从 目前 出 版 商 发 布 的 数据 开放 共享 政策 ,为 建立 开放 科学 数据 政策 的 提出 倡议 计划 等 ， 
说 明 目 前 国外 很 多 出 版 商都 已 开始 重视 科研 数据 的 管理 ， 在 开放 科学 的 环境 推动 之 下 ， 也 
c 在 不 断 的 鼓励 作者 开放 研究 成 果 中 的 数据 .Springer Nature, BMC, PLOS G A til zE T Aat 
= 享 协议 ; Elsevier 数据 政策 主要 服务 于 科研 数据 管理 ， 开 放 共 享 需 针 对 不 同期 刊 的 具体 情况 
进一步 分 析 ，Elsevier 的 态度 是 鼓励 作者 开放 数据 ， 也 进行 了 开放 数据 的 “试点 项 目 ”， 但 
并 不 强制 ，Wiley、OUP 针对 部 分 期 刊 ， 推 出 了 数据 共享 的 政策 规定 ; Hindawii 作为 完全 开 
放 期 刊 出 版 商 在 2017 年 提出 ， 将 制定 开放 数据 政策 作为 一 项 重要 的 工作 在 今年 进行 。 


二 4.2 制定 强制 性 数据 呈 缴 政策 
< 科研 数据 的 呈 缴 政策 应 逐步 趋 于 文档 、 元 数据 强制 性 上 传 机 制 ， 参 照 PLOS 出 版 商 对 投 


稿 的 所 有 文章 执行 统一 规定 ， 规 范 已 发 布 数据 的 格式 、 存 储 位 置 及 使 用 许可 及 等 问题 。 通 过 
= 数据 有 效 性 声明 来 进一步 完善 在 数据 呈 缴 时 需 明确 的 事宜 ， 并 指出 一 旦 违规 的 政策 条 球 ， 
r 即使 文章 出 版 也 将 做 出 相应 的 惩处 措施 《如 撤销 已 发 表 的 文章 ) 。 


4.3 建立 开放 数据 的 同行 评议 体系 


建 并 科研 数据 的 同行 评议 体系 是 保证 高 质量 产 出 、 验 证 学 术 成 果 的 科研 价值 的 一 种 方法 。 
同行 评审 过 程 应 指定 所 采取 的 技术 、 标 准 、 数 据 集 的 匹配 性 与 实验 环境 与 得 出 实验 结论 时 完 
全 相符 ， 即 保证 数据 集 的 完整 性 与 一 致 性 、 相 关 的 标准 、 适 宜 的 软件 等 ， 至 于 科学 质量 与 价 
值 则 交 与 审议 者 、 研 究 人 员 、 实 践 团 体 通过 出 版 前 和 出 版 后 的 同行 评议 进行 评估 。 

科研 数据 的 同行 评议 也 可 与 主要 数据 管理 者 《数据 中 心 和 知识 库 ) 进行 合作 ， 由 于 后 
者 是 科研 数据 内 容 的 主要 持 有 者 ， 提 供 科研 数据 获取 的 链接 。 数 据 管理 者 又 可 保证 科研 数据 
的 技术 质量 、 安 全 管理 与 保存 ， 当 不 断 增加 文章 和 数据 间 的 关联 度 ， 通 过 数据 管理 者 进行 科 
研 数 据 的 质量 控制 ， 更 能 保证 高 质量 数据 的 获取 与 长 期 保存 。 


4.4 开放 数据 仓储 的 规范 


数据 仓储 的 数量 逐年 增加 ， 分 为 不 同学 科 、 不 同 机 构 以 及 综合 性 的 数据 仓储 ， 将 开放 数 
据 按照 学 科 分 布 到 数据 仓储 的 方法 可 更 易于 对 仓储 中 的 数据 进一步 分 析 时 。 出 版 商 在 规定 数 
据 共享 政策 时 ， 也 会 对 适 于 出 版 商 的 数据 仓储 进行 推荐 ， 但 数据 仓储 的 建设 情况 不 同 ， 仓 
储 的 开放 程度 不 同 、 数 据 存储 格式 不 一 等 情况 ， 未 来 应 加 以 规范 。 出 版 商 还 应 加 强 与 高 信任 
度 、 具 有 较为 严格 存储 标准 的 知识 库 和 数据 中 心 合 作 ， 对 于 学 科 对 应 的 数据 中 心 /知识 库 都 
不 具名 ， 出 版 商 可 规划 协议 性 存储 与 访问 ， 以 便于 资源 互通 、 内 容 共 享 。 


4.5 明确 科研 数据 的 再 利用 方式 


对 现 有 开放 数据 集 的 获取 、 利 用 ， 不 同 数据 仓储 有 不 用 的 标准 ， 不 同 的 数据 集 也 有 不 同 
的 标准 。 想 要 进一步 促进 科研 数据 的 再 利用 ， 首 要 任务 应 该 是 明确 数据 集 的 再 利用 方式 和 限 
制 。 在 科研 数据 的 利用 阶段 ， 明 确 数据 引用 政策 ， 注 明 DOI、 许 可 信息 (如 CC 协议 ) 等 ， 
为 使 用 者 提供 明确 的 指导 ， 告 知 科研 数据 的 用 途 与 使 用 规范 。 科 研 数 据 集 存在 隐私 、 机 密 、 涉 
及 生物 遗传 规律 等 ， 因 此 再 利用 的 方式 和 其 体 的 规范 应 更 加 具有 针对 性 ， 对 这 部 分 数据 的 
管理 也 应 严格 限定 ， 可 使 用 的 条 件 要 明确 而 详细 ， 此 举 也 是 促进 开放 数据 发 展 的 重要 一 环 
对 于 基础 科研 数据 的 再 利用 方式 ， 应 尽量 上 共有 普 适 性 、 通 用 性 。 同时， 可 尝试 建 并 文本 与 数 
据 挖 气 (TDM) 的 许可 政策 ， 根 据 作 者 提供 的 数据 使 用 许可 ， 结 合 出 版 机 构 、 数 据 所 存储 的 数 
据 仓储 的 规定 ， 尽 可 能 为 用 户 提 供 深层 次 的 数据 服务 。 


5. 结语 


本 文 以 出 版 机 构 的 开放 科研 数据 政策 作为 研究 的 切入 点 ， 通 过 调研 国外 主流 开放 获取 
期 刊 的 出 版 机 构 并 分 析 其 目前 提出 的 数据 政策 ， 在 总 结 其 政策 内 容 的 基础 上 对 开放 科研 数 
据 政策 未 来 有 待 拓展 的 方面 ， 如 : 制定 强制 性 数据 呈 缴 制度 、 建 立 科 研 数 据 同行 评议 体系 、 
规范 开放 数据 仓储 内 容 ， 明 确 数据 再 利用 方式 等 进行 了 系统 性 的 讨论 。 本 研究 以 期 为 今后 学 
术 出 版 界 制定 更 为 完善 、 全 面 的 开放 科研 数据 政策 提供 参考 与 借鉴 。 然 而 ， 本 研究 选取 的 出 
版 机 构 数量 有 限 ， 未 能 对 众多 出 版 机 构 展 开 更 为 广泛 与 深入 的 调研 ， 未 来 需 继续 跟踪 其 他 
出 版 机 构 的 政策 进展 。 
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